视觉语言模型新突破! Perception LLM硬刚GPT-4o
极市导读:PLM团队用280万人工标注与6610万合成数据,首次在完全开源、零蒸馏的框架内把细粒度视频理解推到逼近GPT-4o的水平,并发布PLM-VideoBench,为社区提供一把可复现的视觉语言模型“透视镜”。
模型 llm 视觉 语言 perceptionllm 2025-08-28 23:13 7
极市导读:PLM团队用280万人工标注与6610万合成数据,首次在完全开源、零蒸馏的框架内把细粒度视频理解推到逼近GPT-4o的水平,并发布PLM-VideoBench,为社区提供一把可复现的视觉语言模型“透视镜”。
模型 llm 视觉 语言 perceptionllm 2025-08-28 23:13 7